# Dieses Script liest eine CSV-Datendatei in GNU R ein.
# Beim Einlesen werden für alle Variablen Beschriftungen (comment) angelegt.
# Die Beschriftungen für Werte wird ebenfalls als Attribute (attr) abgelegt.

#tmpImportFile <- file.choose()
tmpImportFile <- 'sosci_import_computational_journalism_2015-01-29.csv'

dfData<-read.table(
  file=tmpImportFile, fileEncoding="UTF-8",
  header = FALSE, sep = "\t", quote = "\"",
  dec = ".", row.names = "CASE",
  col.names = c(
    "CASE","SERIAL","REF","QUESTNNR","MODE","STARTED","SD01","SD02_01","SD10",
    "SD10_09","SD14","SD14_09","SD18_01","EX01_01","EX01_02","EX01_03","EX01_04",
    "EX01_05","EX01_06","EX01_07","EX01_08","EX01_09","EX01_10","EX01_11","EX01_12",
    "EX02_01","EX02_02","EX02_03","EX02_04","EX02_05","EX02_06","EX02_07","EX02_08",
    "EX02_09","EX02_10","EX02_11","EX02_12","MN01_01","MN01_02","MN01_03","MN01_04",
    "MN01_05","MN01_06","MN02_01","MN02_04","MN02_05","MN02_06","MN02_07","MN02_08",
    "MN02_09","MN02_10","RS01","CH01","CH02_01","CH03","UV01_01","UV04_01",
    "UV04_02","UV04_03","KV01_01","KV01_02","KV01_03","KV01_04","KV01_06","TIME001",
    "TIME002","TIME003","TIME004","TIME005","TIME006","TIME007","TIME008","TIME009",
    "TIME010","TIME_SUM","MAILSENT","LASTDATA","FINISHED","LASTPAGE","MAXPAGE",
    "MISSING","MISSREL","DEG_MISS","DEG_TIME","DEGRADE"
  ),
  as.is = TRUE,
  colClasses = c(
    "integer","character","character","character","character","POSIXct","factor",
    "integer","factor","character","factor","character","character","integer",
    "integer","integer","integer","integer","integer","integer","integer","integer",
    "integer","integer","integer","integer","integer","integer","integer","integer",
    "integer","integer","integer","integer","integer","integer","integer","integer",
    "integer","integer","integer","integer","integer","integer","integer","integer",
    "integer","integer","integer","integer","integer","factor","factor","integer",
    "factor","character","character","character","character","logical","logical",
    "logical","logical","logical","integer","integer","integer","integer","integer",
    "integer","integer","integer","integer","integer","integer","POSIXct","POSIXct",
    "logical","integer","integer","integer","integer","integer","integer","integer"
  ),
  skip = 1,
  check.names = TRUE, fill = TRUE,
  strip.white = FALSE, blank.lines.skip = TRUE,
  comment.char = "",
  na.strings = ""
)

rm(tmpImportFile)

attr(dfData, "project")<-"computational_journalism"
attr(dfData, "description")<-"Roboterjournalismus"
attr(dfData, "date")<-"2015-01-29 09:13:54"
attr(dfData, "server")<-"https://www.soscisurvey.de"

# Variable und Value Labels
dfData$SD01<-factor(dfData$SD01, levels=c("1","2"), labels=c("weiblich","männlich"), ordered=FALSE)
dfData$SD10<-factor(dfData$SD10, levels=c("1","2","3","4","7","8","9"), labels=c("noch Schüler","Schule beendet ohne Abschluss","Hauptschulabschluss/Volksschulabschluss","Realschulabschluss (Mittlere Reife)","Abitur, allgemeine oder fachgebundene Hochschulreife","Hochschulabschluss","anderer Schulabschluss:"), ordered=FALSE)
dfData$SD14<-factor(dfData$SD14, levels=c("1","2","3","4","5","6","7","8","9"), labels=c("Schüler/in","In Ausbildung","Student/in","Angestellte/r","Beamte/r","Selbstständig","Arbeitslos/Arbeit suchend","Im Ruhestand","Sonstiges:"), ordered=FALSE)
dfData$RS01<-factor(dfData$RS01, levels=c("1","2","3"), labels=c("wurde von einem Journalisten geschrieben.","ist computer-generiert.","Ich kann es nicht beurteilen."), ordered=FALSE)
dfData$CH01<-factor(dfData$CH01, levels=c("1","2"), labels=c("Ja","Nein"), ordered=FALSE)
dfData$CH03<-factor(dfData$CH03, levels=c("1","2"), labels=c("Ja","Nein"), ordered=FALSE)
attr(dfData$EX01_01,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_01,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_02,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_02,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_03,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_03,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_04,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_04,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_05,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_05,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_06,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_06,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_07,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_07,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_08,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_08,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_09,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_09,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_10,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_10,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_11,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_11,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX01_12,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX01_12,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_01,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_01,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_02,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_02,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_03,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_03,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_04,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_04,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_05,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_05,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_06,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_06,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_07,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_07,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_08,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_08,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_09,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_09,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_10,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_10,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_11,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_11,"5")<-"Trifft voll und ganz zu."
attr(dfData$EX02_12,"1")<-"Trifft überhaupt nicht zu."
attr(dfData$EX02_12,"5")<-"Trifft voll und ganz zu."
attr(dfData$MN01_01,"1")<-"Seltener/ nie"
attr(dfData$MN01_01,"2")<-"Einmal pro Woche"
attr(dfData$MN01_01,"3")<-"Mehrmals pro Woche"
attr(dfData$MN01_01,"4")<-"Einmal pro Tag"
attr(dfData$MN01_01,"5")<-"Mehrmals pro Tag"
attr(dfData$MN01_02,"1")<-"Seltener/ nie"
attr(dfData$MN01_02,"2")<-"Einmal pro Woche"
attr(dfData$MN01_02,"3")<-"Mehrmals pro Woche"
attr(dfData$MN01_02,"4")<-"Einmal pro Tag"
attr(dfData$MN01_02,"5")<-"Mehrmals pro Tag"
attr(dfData$MN01_03,"1")<-"Seltener/ nie"
attr(dfData$MN01_03,"2")<-"Einmal pro Woche"
attr(dfData$MN01_03,"3")<-"Mehrmals pro Woche"
attr(dfData$MN01_03,"4")<-"Einmal pro Tag"
attr(dfData$MN01_03,"5")<-"Mehrmals pro Tag"
attr(dfData$MN01_04,"1")<-"Seltener/ nie"
attr(dfData$MN01_04,"2")<-"Einmal pro Woche"
attr(dfData$MN01_04,"3")<-"Mehrmals pro Woche"
attr(dfData$MN01_04,"4")<-"Einmal pro Tag"
attr(dfData$MN01_04,"5")<-"Mehrmals pro Tag"
attr(dfData$MN01_05,"1")<-"Seltener/ nie"
attr(dfData$MN01_05,"2")<-"Einmal pro Woche"
attr(dfData$MN01_05,"3")<-"Mehrmals pro Woche"
attr(dfData$MN01_05,"4")<-"Einmal pro Tag"
attr(dfData$MN01_05,"5")<-"Mehrmals pro Tag"
attr(dfData$MN01_06,"1")<-"Seltener/ nie"
attr(dfData$MN01_06,"2")<-"Einmal pro Woche"
attr(dfData$MN01_06,"3")<-"Mehrmals pro Woche"
attr(dfData$MN01_06,"4")<-"Einmal pro Tag"
attr(dfData$MN01_06,"5")<-"Mehrmals pro Tag"
attr(dfData$MN02_01,"1")<-"Rangplatz 1"
attr(dfData$MN02_01,"2")<-"Rangplatz 2"
attr(dfData$MN02_01,"3")<-"Rangplatz 3"
attr(dfData$MN02_01,"4")<-"Rangplatz 4"
attr(dfData$MN02_01,"5")<-"Rangplatz 5"
attr(dfData$MN02_01,"6")<-"Rangplatz 6"
attr(dfData$MN02_01,"7")<-"Rangplatz 7"
attr(dfData$MN02_01,"8")<-"Rangplatz 8"
attr(dfData$MN02_04,"1")<-"Rangplatz 1"
attr(dfData$MN02_04,"2")<-"Rangplatz 2"
attr(dfData$MN02_04,"3")<-"Rangplatz 3"
attr(dfData$MN02_04,"4")<-"Rangplatz 4"
attr(dfData$MN02_04,"5")<-"Rangplatz 5"
attr(dfData$MN02_04,"6")<-"Rangplatz 6"
attr(dfData$MN02_04,"7")<-"Rangplatz 7"
attr(dfData$MN02_04,"8")<-"Rangplatz 8"
attr(dfData$MN02_05,"1")<-"Rangplatz 1"
attr(dfData$MN02_05,"2")<-"Rangplatz 2"
attr(dfData$MN02_05,"3")<-"Rangplatz 3"
attr(dfData$MN02_05,"4")<-"Rangplatz 4"
attr(dfData$MN02_05,"5")<-"Rangplatz 5"
attr(dfData$MN02_05,"6")<-"Rangplatz 6"
attr(dfData$MN02_05,"7")<-"Rangplatz 7"
attr(dfData$MN02_05,"8")<-"Rangplatz 8"
attr(dfData$MN02_06,"1")<-"Rangplatz 1"
attr(dfData$MN02_06,"2")<-"Rangplatz 2"
attr(dfData$MN02_06,"3")<-"Rangplatz 3"
attr(dfData$MN02_06,"4")<-"Rangplatz 4"
attr(dfData$MN02_06,"5")<-"Rangplatz 5"
attr(dfData$MN02_06,"6")<-"Rangplatz 6"
attr(dfData$MN02_06,"7")<-"Rangplatz 7"
attr(dfData$MN02_06,"8")<-"Rangplatz 8"
attr(dfData$MN02_07,"1")<-"Rangplatz 1"
attr(dfData$MN02_07,"2")<-"Rangplatz 2"
attr(dfData$MN02_07,"3")<-"Rangplatz 3"
attr(dfData$MN02_07,"4")<-"Rangplatz 4"
attr(dfData$MN02_07,"5")<-"Rangplatz 5"
attr(dfData$MN02_07,"6")<-"Rangplatz 6"
attr(dfData$MN02_07,"7")<-"Rangplatz 7"
attr(dfData$MN02_07,"8")<-"Rangplatz 8"
attr(dfData$MN02_08,"1")<-"Rangplatz 1"
attr(dfData$MN02_08,"2")<-"Rangplatz 2"
attr(dfData$MN02_08,"3")<-"Rangplatz 3"
attr(dfData$MN02_08,"4")<-"Rangplatz 4"
attr(dfData$MN02_08,"5")<-"Rangplatz 5"
attr(dfData$MN02_08,"6")<-"Rangplatz 6"
attr(dfData$MN02_08,"7")<-"Rangplatz 7"
attr(dfData$MN02_08,"8")<-"Rangplatz 8"
attr(dfData$MN02_09,"1")<-"Rangplatz 1"
attr(dfData$MN02_09,"2")<-"Rangplatz 2"
attr(dfData$MN02_09,"3")<-"Rangplatz 3"
attr(dfData$MN02_09,"4")<-"Rangplatz 4"
attr(dfData$MN02_09,"5")<-"Rangplatz 5"
attr(dfData$MN02_09,"6")<-"Rangplatz 6"
attr(dfData$MN02_09,"7")<-"Rangplatz 7"
attr(dfData$MN02_09,"8")<-"Rangplatz 8"
attr(dfData$MN02_10,"1")<-"Rangplatz 1"
attr(dfData$MN02_10,"2")<-"Rangplatz 2"
attr(dfData$MN02_10,"3")<-"Rangplatz 3"
attr(dfData$MN02_10,"4")<-"Rangplatz 4"
attr(dfData$MN02_10,"5")<-"Rangplatz 5"
attr(dfData$MN02_10,"6")<-"Rangplatz 6"
attr(dfData$MN02_10,"7")<-"Rangplatz 7"
attr(dfData$MN02_10,"8")<-"Rangplatz 8"
attr(dfData$CH02_01,"1")<-"Eintracht Braunschweig"
attr(dfData$CH02_01,"11")<-"1. FC Nürnberg"
attr(dfData$KV01_01,"F")<-"nicht gewählt"
attr(dfData$KV01_01,"T")<-"ausgewählt"
attr(dfData$KV01_02,"F")<-"nicht gewählt"
attr(dfData$KV01_02,"T")<-"ausgewählt"
attr(dfData$KV01_03,"F")<-"nicht gewählt"
attr(dfData$KV01_03,"T")<-"ausgewählt"
attr(dfData$KV01_04,"F")<-"nicht gewählt"
attr(dfData$KV01_04,"T")<-"ausgewählt"
attr(dfData$KV01_06,"F")<-"nicht gewählt"
attr(dfData$KV01_06,"T")<-"ausgewählt"
attr(dfData$FINISHED,"F")<-"abgebrochen"
attr(dfData$FINISHED,"F")<-"ausgefüllt"
comment(dfData$SERIAL)<-"Seriennummer (sofern verwendet)"
comment(dfData$REF)<-"Referenz (sofern im Link angegeben)"
comment(dfData$QUESTNNR)<-"Fragebogen, der im Interview verwendet wurde"
comment(dfData$MODE)<-"Interview-Modus"
comment(dfData$STARTED)<-"Zeitpunkt zu dem das Interview begonnen hat"
comment(dfData$SD01)<-"Geschlecht"
comment(dfData$SD02_01)<-"Alter (direkt): Ich bin   ... Jahre alt."
comment(dfData$SD10)<-"Formale Bildung"
comment(dfData$SD10_09)<-"Formale Bildung: anderer Schulabschluss"
comment(dfData$SD14)<-"Beschäftigung"
comment(dfData$SD14_09)<-"Beschäftigung: Sonstiges"
comment(dfData$SD18_01)<-"Anmerkungen (offen): [01]"
comment(dfData$EX01_01)<-"Bewertung Fußball: verlässlich"
comment(dfData$EX01_02)<-"Bewertung Fußball: fair"
comment(dfData$EX01_03)<-"Bewertung Fußball: glaubhaft"
comment(dfData$EX01_04)<-"Bewertung Fußball: fehlerfrei"
comment(dfData$EX01_05)<-"Bewertung Fußball: lebendig"
comment(dfData$EX01_06)<-"Bewertung Fußball: interessant"
comment(dfData$EX01_07)<-"Bewertung Fußball: unterhaltsam"
comment(dfData$EX01_08)<-"Bewertung Fußball: gut geschrieben"
comment(dfData$EX01_09)<-"Bewertung Fußball: prägnant"
comment(dfData$EX01_10)<-"Bewertung Fußball: schlüssig"
comment(dfData$EX01_11)<-"Bewertung Fußball: erklärend"
comment(dfData$EX01_12)<-"Bewertung Fußball: verständlich"
comment(dfData$EX02_01)<-"Bewertung Finanzen: verlässlich"
comment(dfData$EX02_02)<-"Bewertung Finanzen: fair"
comment(dfData$EX02_03)<-"Bewertung Finanzen: glaubhaft"
comment(dfData$EX02_04)<-"Bewertung Finanzen: fehlerfrei"
comment(dfData$EX02_05)<-"Bewertung Finanzen: lebendig"
comment(dfData$EX02_06)<-"Bewertung Finanzen: interessant"
comment(dfData$EX02_07)<-"Bewertung Finanzen: unterhaltsam"
comment(dfData$EX02_08)<-"Bewertung Finanzen: gut geschrieben"
comment(dfData$EX02_09)<-"Bewertung Finanzen: prägnant"
comment(dfData$EX02_10)<-"Bewertung Finanzen: schlüssig"
comment(dfData$EX02_11)<-"Bewertung Finanzen: erklärend"
comment(dfData$EX02_12)<-"Bewertung Finanzen: verständlich"
comment(dfData$MN01_01)<-"Infoquellen: Zeitungen"
comment(dfData$MN01_02)<-"Infoquellen: Zeitschriften"
comment(dfData$MN01_03)<-"Infoquellen: TV-Nachrichten"
comment(dfData$MN01_04)<-"Infoquellen: Radio"
comment(dfData$MN01_05)<-"Infoquellen: Online auf dem Smartphone oder Tablet"
comment(dfData$MN01_06)<-"Infoquellen: Online am PC oder Laptop"
comment(dfData$MN02_01)<-"Themen: Politik"
comment(dfData$MN02_04)<-"Themen: Wirtschaft"
comment(dfData$MN02_05)<-"Themen: Wissen/Technik"
comment(dfData$MN02_06)<-"Themen: Unterhaltung"
comment(dfData$MN02_07)<-"Themen: Finanzen"
comment(dfData$MN02_08)<-"Themen: Sport"
comment(dfData$MN02_09)<-"Themen: Kultur"
comment(dfData$MN02_10)<-"Themen: Gesundheit"
comment(dfData$RS01)<-"Ratespiel"
comment(dfData$CH01)<-"Check Finanzen"
comment(dfData$CH02_01)<-"Check Fußball: Eintracht Braunschweig/1. FC Nürnberg"
comment(dfData$CH03)<-"Check Fußball JN"
comment(dfData$UV01_01)<-"IntVar für Urne Wetter: 1"
comment(dfData$UV04_01)<-" UV04 : erstes Thema"
comment(dfData$UV04_02)<-" UV04 : Gruppe für erstes Thema"
comment(dfData$UV04_03)<-" UV04 : Gruppe für zweites Thema"
comment(dfData$KV01_01)<-"KV Journ: Ja, als Journalist (hauptberuflich oder freier Mitarbeiter)"
comment(dfData$KV01_02)<-"KV Journ: Ja, im Bereich der Public Relations/Unternehmenskommunikation"
comment(dfData$KV01_03)<-"KV Journ: Ja, in meiner Freizeit (z.B. als Hobby-Blogger)"
comment(dfData$KV01_04)<-"KV Journ: Ja, während des Studiums/der Ausbildung/der Schulzeit"
comment(dfData$KV01_06)<-"KV Journ: Nein, ich habe keine Erfahrungen im Verfassen von (journalistischen) Texten/Artikeln"
comment(dfData$TIME001)<-"Verweildauer Seite 1"
comment(dfData$TIME002)<-"Verweildauer Seite 2"
comment(dfData$TIME003)<-"Verweildauer Seite 3"
comment(dfData$TIME004)<-"Verweildauer Seite 4"
comment(dfData$TIME005)<-"Verweildauer Seite 5"
comment(dfData$TIME006)<-"Verweildauer Seite 6"
comment(dfData$TIME007)<-"Verweildauer Seite 7"
comment(dfData$TIME008)<-"Verweildauer Seite 8"
comment(dfData$TIME009)<-"Verweildauer Seite 9"
comment(dfData$TIME010)<-"Verweildauer Seite 10"
comment(dfData$TIME_SUM)<-"Verweildauer gesamt (ohne Ausreißer)"
comment(dfData$MAILSENT)<-"Versandzeitpunkt der Einladungsmail (nur für nicht-anonyme Adressaten)"
comment(dfData$LASTDATA)<-"Zeitpunkt als der Datensatz das letzte mal geändert wurde"
comment(dfData$FINISHED)<-"Status (wurde die Befragung abgeschlossen?)"
comment(dfData$LASTPAGE)<-"Seite, die der Teilnehmer zuletzt bearbeitet hat"
comment(dfData$MAXPAGE)<-"Letzte Seite, die im Fragebogen bearbeitet wurde"
comment(dfData$MISSING)<-"Anteil fehlender Antworten in Prozent"
comment(dfData$MISSREL)<-"Anteil fehlender Antworten (gewichtet nach Relevanz)"
comment(dfData$DEG_MISS)<-"Maluspunkte für fehlende Antworten"
comment(dfData$DEG_TIME)<-"Maluspunkte für schnelles Ausfüllen"
comment(dfData$DEGRADE)<-"Maluspunkte gesamt"